近年来,机器学习已显示出广泛的增长,现在通常应用于敏感区域。为了在部署前进行适当的预测模型验证,模型必须是确定性的。但是,主要的机器学习库默认用于基于原子操作的非确定性算法的使用。仅修复所有随机种子不足以确定性机器学习。为了克服这一缺点,各种机器学习库发布了与非确定性算法的确定性对应物。我们评估了这些算法对确定性和运行时的影响。基于这些结果,我们为确定性机器学习制定了一系列要求,并开发了新的软件解决方案MLF核心生态系统,该解决方案有助于机器学习项目以满足并保持这些要求。我们应用了MLF核心在各种生物医学领域开发确定性模型,包括带有张量的单细胞自动编码器,基于Pytorch的CT扫描中的基于Pytorch的U-NET模型,以及基于XGBoost的基因表达谱的肝癌分割和基于肝癌的肝癌分类器。
translated by 谷歌翻译